لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش جدال داده با پایتون 3.x [ویدئو]
Data Wrangling with Python 3.x [Video]
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
شما ممکن است در یک سازمان کار کنید، یا کسب و کار خود را داشته باشید، جایی که داده ها به طور مداوم (ساختار یافته یا بدون ساختار) تولید می شوند و به دنبال توسعه مهارت های خود هستید تا بتوانید به حوزه علم داده بپرید. این راهنمای عملی به برنامه نویسان نحوه پردازش اطلاعات را نشان می دهد.
در این دوره، دادهها را جمعآوری میکنید، دادهها را برای تجزیه و تحلیل آماده میکنید، تجزیه و تحلیلهای آماری ساده انجام میدهید، تجسم دادههای معنادار ایجاد میکنید و موارد دیگر! این دوره ما را به ابزارها و فناوریها مجهز میکند، همچنین باید مجموعه دادهها را با استفاده از پایتون تجزیه و تحلیل کنیم تا بتوانیم با اطمینان وارد میدان شویم و مجموعه مهارتهای خود را افزایش دهیم. بهترین بخش این دوره، الگوهای کد آماده تولید شده با استفاده از مجموعه داده های واقعی است.
در پایان دوره، ما یک درک بصری از تمام جنبههای موجود در پایتون برای جدال داده ایجاد خواهیم کرد.
تمامی کدها و فایل های پشتیبانی در این لینک در GitHub قرار داده شده است:
https://github.com/PacktPublishing/-Data-Wrangling-with-Python-3.x 1) قبل از انجام هر گونه تجزیه و تحلیل روی مجموعه داده، داده ها (ساختار یافته یا بدون ساختار) را به طور موثر پیش پردازش کنید.
2) بازیابی داده ها از منابع داده های مختلف (CSV، JSON، Excel، PDF) و تجزیه آنها در پایتون برای دادن شکلی معنی دار به آنها.
3) در مورد مکان های ذخیره سازی داده های شگفت انگیز در یک صنعت که به شدت بهینه می شوند، بیاموزید.
4) تجزیه و تحلیل آماری را با استفاده از کتابخانه های داخلی پایتون انجام دهید.
5) هک ها، نکات و تکنیک هایی که در طول حرفه شما در علم داده ارزشمند خواهند بود.
این دوره برای توسعه دهندگان پایتون، تحلیلگران داده و متخصصان فناوری اطلاعات است که علاقه مند به کاوش در تجزیه و تحلیل داده ها/بینش برای غنی سازی پروژه های شخصی یا حرفه ای فعلی خود هستند.
داشتن یک ایده ابتدایی در مورد پایگاه داده رابطه ای و SQL یک امتیاز خواهد بود. حتی توسعه دهندگان باتجربه پایتون می توانند از این دوره بهره ببرند زیرا بر جنبه های مهندسی داده تمرکز دارد.
برای دستیابی به اهداف تحلیلی خود با کار با مشکلات دنیای واقعی، جدال موثر داده را انجام دهید. * راهنمای گام به گام برای به دست آوردن و سپس پیش پردازش مجموعه داده ها برای به دست آوردن بینش مفید از آنها. * از ویژگی های داخلی پایتون برای به دست آوردن، تمیز کردن، تجزیه و تحلیل و ارائه کارآمد داده ها استفاده کنید. *
سرفصل ها و درس ها
جمع آوری و تجزیه داده ها
Gathering and Parsing Data
بررسی اجمالی دوره
The Course Overview
نصب Anaconda Navigator در ویندوز/لینوکس
Installing Anaconda Navigator on Windows/Linux
وارد کردن و تجزیه CSV در پایتون
Importing and Parsing CSV in Python
وارد کردن و تجزیه JSON در پایتون
Importing and Parsing JSON in Python
خراش دادن داده ها از وب عمومی - قسمت 1
Scraping Data from Public Web – Part 1
خراش دادن داده ها از وب عمومی - قسمت 2
Scraping Data from Public Web – Part 2
کار با داده ها از فایل های اکسل و پی دی اف
Working with Data from Excel and PDF Files
وارد کردن و تجزیه فایل های اکسل – قسمت 1
Importing and Parsing Excel Files – Part 1
وارد کردن و تجزیه فایل های اکسل – قسمت 2
Importing and Parsing Excel Files – Part 2
دستکاری فایل های PDF در پایتون – قسمت 1
Manipulating PDF Files in Python – Part 1
دستکاری فایل های PDF در پایتون – قسمت 2
Manipulating PDF Files in Python – Part 2
ذخیره سازی داده ها در ذخیره سازی دائمی
Storing Data in Persistent Storage
تفاوت بین پایگاه داده های رابطه ای و غیر رابطه ای
Difference between Relational and Non-Relational Databases
ذخیره داده ها در پایگاه های داده SQLite
Storing Data in SQLite Databases
ذخیره داده ها در MongoDB
Storing Data in MongoDB
ذخیره داده ها در Elasticsearch
Storing Data in Elasticsearch
مطالعه تطبیقی پایگاه های داده برای ذخیره سازی
Comparative Study of Databases for Storage
پاکسازی داده های ساخت یافته
Cleaning Structured Data
مهم ترین مرحله در تجزیه و تحلیل داده ها
The Most Important Step in Data Analysis
تغییر نام/افزودن/حذف ستون های DataFrame
Renaming/Adding/Removing the DataFrame Columns
حذف ردیف های تکراری
Dropping Duplicate Rows
نمایه سازی DataFrame برای بازیابی ستون ها و ردیف های خاص
Indexing DataFrame to Retrieve Specific Columns and Rows
ادغام/الحاق/پیوستن به DataFrame
Merging/Concatenating/Joining DataFrames
مقابله با ارزش های گمشده
Dealing with Missing Values
پاکسازی و تبدیل اطلاعات بیشتر
More Data Cleaning and Transformation
فیلتر کردن و مرتب سازی DataFrame
Filtering and Sorting of DataFrame
رمزگذاری/نقشه گذاری مقادیر موجود – قسمت 1
Encoding/Mapping Existing Values – Part 1
رمزگذاری/نقشه گذاری مقادیر موجود – قسمت 2
Encoding/Mapping Existing Values – Part 2
تغییر مقیاس/استاندارد کردن مقادیر ستون
Rescale/Standardize Column Values
عملیات تمیز کردن متداول
Common Cleaning Operations
صادرات مجموعه داده برای استفاده در آینده
Exporting Datasets for Future Use
انجام تجزیه و تحلیل آماری
Performing Statistical Analysis
کاربردهای مختلف پکیج ها (پاندا، نامپای، اسکی پای و متپلاتلب)
Different Uses of Packages (Pandas, NumPy, SciPy, and Matplotlib)
انواع نام ستون ها/ویژگی ها/ویژگی ها در داده های ساخت یافته
Types of Column Names/Features/Attributes in Structured Data
Split-Apply-Combine (انجام گروه بر اساس عملیات)
Split-Apply-Combine (Performing Group By Operation)
آمار توصیفی با استفاده از پایتون - قسمت 1
Descriptive Statistics Using Python – Part 1
آمار توصیفی با استفاده از پایتون - قسمت 2
Descriptive Statistics Using Python – Part 2
بگذارید تجسم ها داستان را بگویند
Let the Visualizations Tell the Story
استفاده از تجسم ها
Using Visualizations
تجسم جالب مجموعه داده های دنیای واقعی از تکامل جمعیت جهان
Cool Visualization of Real-World Datasets of World Population Evolution
تجسم در پایتون - قسمت 1
Visualizations in Python – Part 1
تجسم در پایتون - قسمت 2
Visualizations in Python – Part 2
کاوش یک ابزار تجسم آنلاین (RAWGraphs)
Exploring an Online Visualization Tool (RAWGraphs)
نمایش نظرات
Packtpub یک ناشر دیجیتالی کتابها و منابع آموزشی در زمینه فناوری اطلاعات و توسعه نرمافزار است. این شرکت از سال 2004 فعالیت خود را آغاز کرده و به تولید و انتشار کتابها، ویدیوها و دورههای آموزشی میپردازد که به توسعهدهندگان و متخصصان فناوری اطلاعات کمک میکند تا مهارتهای خود را ارتقا دهند. منابع آموزشی Packtpub موضوعات متنوعی از جمله برنامهنویسی، توسعه وب، دادهکاوی، امنیت سایبری و هوش مصنوعی را پوشش میدهد. محتوای این منابع به صورت کاربردی و بهروز ارائه میشود تا کاربران بتوانند دانش و تواناییهای لازم برای موفقیت در پروژههای عملی و حرفهای خود را کسب کنند.
جمشید سهیل علاقه زیادی به علم داده، یادگیری ماشین، بینایی کامپیوتر و پردازش زبان طبیعی دارد و بیش از 2 سال تجربه در این صنعت دارد. او در یک استارت آپ مستقر در سیلیکون ولی به نام FunnelBeam، که بنیانگذاران آن از دانشگاه استنفورد هستند، به عنوان دانشمند داده کار کرده است. در حال حاضر، او به عنوان دانشمند داده در Systems Limited مشغول به کار است. او بیش از 66 دوره آنلاین را از پلتفرم های مختلف گذرانده است. او کتاب Data Wrangling with Python 3.X را برای Packt Publishing تالیف کرده و چندین کتاب و دوره را بررسی کرده است. او همچنین در حال توسعه یک دوره جامع در زمینه علوم داده در Educative است و در حال نوشتن کتاب برای چندین ناشر است.
نمایش نظرات